자율주행자동차의 안전 주행을 위한 강화학습 알고리즘의 연속적인 행동 공간 이산화

주호택; 박현철; 김경중; HoTaek Joo; HyunCheol Park; Kyungjoong Kim

연구문헌

학술대회 프로시딩

홈 > 연구문헌 > 학술대회 프로시딩 > 한국정보과학회 학술대회 > KSC 2018

KSC 2018

Current Result Document :

한글제목(Korean Title)	자율주행자동차의 안전 주행을 위한 강화학습 알고리즘의 연속적인 행동 공간 이산화
영문제목(English Title)	Discretization of continuous Action Space of Reinforcement Algorithm for Safe Autonomous Vehicle Driving
저자(Author)	주호택 박현철 김경중 HoTaek Joo HyunCheol Park Kyungjoong Kim
원문수록처(Citation)	VOL 45 NO. 02 PP. 0776 ~ 0778 (2018. 12)
한글내용 (Korean Abstract)	자율주행 자동차 분야에서 강화학습(Reinforcement Learning) 은 딥러닝 (deep learning)과 함께 가장 주목받는 기술이다. 강화학습이란 기계 학습의 방법 중 하나로 현재 상태(state)에서 어떤 행동(action)을 선택했을 때 받는 미래 보상(reward)의 힘을 최대화하는 방향으로 행동하여 학습하는 방법이다. 본 논문의 선행 연구에서 자율주행 자동차와 같은 연속적인 행동 공간(Continuous Action Space)에서 기존의 강화학습을 적용하면 직선코스에서의 핸들 떨림 문제를 확인하였다. 본 논문에서는 이 문제를 해결하기 위하여 연속적인 행동 공간을 이산화(discretization)하는 방법을 제시하였으며, 이를 구현하기 위해 경주용 차량 시뮬레이션인 TORCS(The Open Racing Car Simulator)에서 강화학습 알고리즘 중 하나인 PPO(Proximal Policy Optimization)을 접목하여 실험을 진행하였다.
영문내용 (English Abstract)
키워드(Keyword)
파일첨부	PDF 다운로드